循环神经网络折叠模型
再次观察这个折叠模型(如上所示)。假设符号E表示误差。经过一个时间步长后,权重矩阵V1在时间t如何更新呢?
方程式 A
方程式 B
方程式 C
方程式 D
方程式 B 是恰当使用学习率、正确推导链式法则的唯一方程。
Next Concept